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摘要 : 为 了 帮助 青年 新 冠 感染 人 和 群 在 疫情 结束 后 恢复 和 发 展 心理 健康 平衡 状态 ， 
我 们 开发 了 可 以 作为 现 有 心理 健康 资源 补充 的 在 线 自 助 心理 干预 机 器 人 。 首 先 ， 
我 们 利用 提示 工程 技术 ， 基 于 大 语言 模型 GPT-4 构建 擅长 问题 解决 疗法 
(Problem-Solving Therapy，PST) 的 聊天 机 器 人 。 然 后 进行 预测 试 和 正式 实验 
来 验证 聊天 机 器 人 的 有 效 性 。 预 测试 的 结果 表明 聊天 机 器 人 在 与 用 户 的 交互 过 程 
中 遵守 问题 解决 疗法 的 核心 工作 步骤 。 正 式 实验 的 结果 显示 ，PST 聊天 机 器 人 在 
问题 识别 和 问题 解决 维度 上 的 表现 好 于 普通 聊天 机 器 人 , 说 明 PST 聊天 机 器 人 可 
以 帮助 用 户 更 快 定位 困扰 自己 的 问题 和 以 及 制定 出 可 行 的 问题 解决 计划 。 但 在 关 
系 质量 维度 上 PST 聊天 机 器 人 与 普通 聊天 机 器 人 没有 差别 , 也 没有 在 性 别 和 新 冠 
后 遗 症 这 两 个 因素 上 发 现 对 两 种 聊天 机 器 人 的 评价 有 差异 。 说 明 PST 聊天 机 器 人 
的 人 机 关系 质量 没有 显著 提升 , 但 聊天 机 器 人 的 普遍 可 接受 性 和 广泛 适用 性 仍 在 
实际 应 用 中 具有 一 定 优势 .研究 结果 支持 大 语言 模型 在 创新 性 实现 心理 自助 干预 
方面 的 可 能 性 。 

关键 词 ， 自 助 心理 干预 GPT4 ”问题 解决 疗法 聊天 机 器 人 
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Abstract: To assist young people infected with COVID-19 restore and 
develop a balanced state of mental health after the pandemic, we have 


developed an online self-help psychological intervention robot that can 
complement existing mental health resources. First, we utilized prompting 
engineering techniques to build a chatbot skilled in Problem-Solving 
Therapy (PST) based on the large language model GPT-4. Then, we conducted 
pre-testing and formal experiments to verify the effectiveness of the 
chatbot. The results of the pre-testing indicated that the chatbot 
followed the core work steps of PST during interactions with users. The 
results of the formal experiment showed that the PST chatbot performed 
better than the ordinary chatbot in terms of problem identification and 
problem-solving dimensions, indicating that the PST chatbot can help 
users quickly locate the problems that trouble them and develop feasible 
problem-solving plans. However, there was no difference between the PST 
chatbot and the ordinary chatbot in terms of relationship quality, and 
no differences were found in the evaluation of the two chatbots based on 
gender and post-COVID symptoms. This suggests that the PST chatbot did 
not significantly improve the quality of human-machine relationships, but 
the general acceptability and wide applicability of chatbots still have 
certain advantages in practical applications. The research results 
support the possibility of using large language models in innovative 
implementations of psychological self-help interventions. 

Keywords: Self-help Psychological Intervention GPT-4 Problem-Solving 
Therapy Chatbot 


1 研究 背景 


COVID-19 大 流行 期 间 所 带 来 的 多 重 压力 和 挑战 显著 加 剧 了 青年 人 的 心理 
EJ, 对 他 们 的 心理 健康 产生 了 持续 影响 。 许多 患者 在 康复 后 报告 了 持续 的 心理 
健康 问题 ,包括 焦虑 、 抑 郁 、 创 伤 后 应 激 障 碍 、 情 绪 波 动 和 认 知 功能 下 降 (例如 

“Fix 35”) (Al-Aly, Xie, & Bowe, 2021; Lopez-Leon et al., 2021; Mazza et al., 2020), 
这 些 心理 健康 问题 都 是 自杀 风险 的 重要 来 源 。 同 时 ， 在 心理 健康 领域 ， 社 会 支持 
被 广泛 认为 是 自杀 风险 的 保护 因素 ， Kleiman 和 Liu (2013) 的 研究 表明 ， 感 到 
被 他 人 所 关心 和 支持 的 个 体 在 面临 危机 时 更 有 可 能 寻求 帮助 。Thoits (2011) 指出 ， 
良好 的 社会 支持 网 络 可 以 提供 情感 支持 、 信息 反 馈 、 帮 助 个 体 应 对 困难 的 建议 和 
实际 援助 ， 是 一 种 降低 自杀 风险 可 行 的 手段 。 因 此 ， 针 对 后 疫情 时 代 仍 然 需要 心 
理 健 康文 持 的 青年 新 冠 感染 人 群 , 帮助 他 们 在 这 一 关键 的 人 生 阶 段 恢 复 和 发 展 心 
理 健康 平衡 状态 , 降低 他 们 的 自杀 风险 , 我 们 需要 开发 一 种 易于 获得 的 心理 健康 
SCH RIE 

随 着 数字 技术 的 快速 发 展 ， 自 助 心 理 干预 工具 ， 特 别 是 聊天 机 器 人 ， 已 经 成 

为 一 种 创新 的 社会 支持 形式 ， 提 供 了 一 种 低 成 本 、 易 于 访问 和 匿名 的 方法 来 帮助 


Ms 


那些 可 能 由 于 地 理 位 置 、 社 会 污 名 或 资金 有 限 而 无 法 获得 传统 治疗 的 人 群 
(Vaidyam, Wisniewski, Halamka, Kashavan, & Torous, 2019)。 这 些 聊天 机 器 人 基于 
人 工 智 能 ， 可 通过 模拟 对 话 提供 实时 反馈 ， 文 持 和 指导 ， 它 们 为 用 户 提供 了 一 个 
非 评判 性 的 环境 ， 让 用 户 能 自由 地 表达 自己 的 感受 和 忧虑 (Fitzpatrick, Darcy, & 
Vierhile, 2017)。 利 用 心理 疗法 构建 聊天 机 器 人 为 人 们 提供 心理 干预 可 以 作为 心理 
健康 服务 的 一 个 有 用 补充 (Fitzpatrick et al., 2017)。 

问题 解决 疗法 (Problem-Solving Therapy, PST) 是 一 种 强调 通过 提高 个 人 解 
决 日 常生 活 问题 的 技能 来 减轻 心理 压力 和 管理 心理 健康 问题 的 心理 疗法 。PST 的 
核心 假设 是 , 应 对 生活 中 的 有 具体 问题 的 能 力 与 心理 健康 状况 直接 相关 。 通 过 教授 
有 效 的 问题 解决 技巧 ，PST 旨 在 提高 人 们 的 自我 效能 感 和 对 生活 事件 的 控制 感 ， 
从 而 帮助 他 们 减少 和 管理 抑郁 、 焦虑 和 其 他 心理 健康 问题 (Malouff, Thorsteinsson, 
& Schutte, 2007; Nezu, Nezu, & D’Zurilla, 2012)。 基 于 问题 解决 疗法 的 聊天 机 器 人 
开发 的 可 行 性 得 到 了 研究 者 的 关注 。 如 此 类 工具 通过 提供 交互 式 的 环境 ,引导 用 
户 通过 PST 的 步骤 ， 帮 助 用 户 识别 问题 、 生 成 解雇 方案 、 做 出 决策 并 实施 解决 
方案 。 由 于 聊天 机 器 人 可 以 24 小 时 提供 支持 ， 它 们 特别 适合 于 提供 连贯 的 、 按 
需 的 干预 ， 而 不 需要 像 传统 面对面 治疗 那样 的 资源 投入 (Ly et al., 2014)。 

通过 大 语言 模型 (Large Language Model, LLM) 和 提示 工程 (Prompt 
Engineering，PE)， 我 们 可 以 将 问题 解决 疗法 整合 到 聊天 机 器 人 程序 中 ， 以 帮助 
个 人 管理 自己 的 问题 , 从 而 提高 提高 心理 健康 干预 的 可 达 性 和 效率 。 大 语言 模型 ， 
例如 GPT-3 或 GPT-4, 是 基于 深度 学 习 的 人 工 智 能 模型 ,它们 能 够 理解 和 生成 人 
类 语言 。 这 些 模型 通过 在 大 量 文本 数据 上 进行 训练 来 学 习 语言 的 复杂 性 以 及 如 何 
回答 问题 、 提 供 信 息 、 撰 写 文本 等 。 提 示 工 程 是 设计 和 改进 提示 语 来 指导 大 型 语 
言 模型 产生 所 需 输出 的 过 程 。 

综 上 所 述 ， 研 究 的 目标 是 基于 提示 工程 技术 利用 GPT4 来 构建 PST 聊天 机 
器 人 , 为 青年 新 冠 感染 人 群 在 提供 自助 心理 干预 渠道 , 平稳 度 过 疫情 结束 后 的 心 
理 动 荡 时 期 。GPT4 具有 强大 的 知识 库 和 逻辑 推理 能 力 ， 预 期 利用 GPT4 构建 的 
PST 聊天 机 器 人 可 以 为 青年 新 冠 感染 人 和 群 提供 情感 支持 、 信 息 反 馈 以 及 应 对 困难 
的 建议 ， 从 而 提高 他 们 解决 问题 的 效能 感 ， 降 低 自 杀 风 险 。 


2 研究 方法 


2.1 构建 PST 聊天 机 器 人 


第 一 步 : 设计 提示 语 (prompt) 


利用 提示 工程 技术 , 使 用 合适 的 提示 语 指导 大 语言 模型 GPT4 生成 符合 问题 
解决 疗法 的 输出 内 容 。 首 先 创 建 初始 提示 ,要求 聊 天 机 器 人 的 对 话 逻 辑 基 于 问题 
解决 疗法 的 核心 原则 和 流程 。 然 后 进行 迭代 测试 ， 使 用 设计 的 提示 与 模型 交互 ， 


并 观察 输出 是 否 与 期 望 一 致 。 根 据 测 试 结果 调整 提示 的 结构 、 语 言 和 细节 ， 以 改 


进 模型 的 输出 ， 最 终 得 到 合适 的 提示 语 。 具 体 流程 见 图 1。 


— 


C1) 初始 提示 编写 : 
在 基于 问题 解决 疗法 (PST) 构建 初始 提示 时 ， 将 提示 设计 得 精细 且 全 面 ， 
围绕 问题 解决 疗法 的 核心 步骤 提供 帮助 。 指 导 聊 天 机 器 人 为 用 户 提 


以 引导 GPT4 


诚实 的 对 话 ， 


(2) 迭代 测试 与 调整 : 


协助 用 户 通 过 一 系列 结构 化 的 步骤 达成 心理 上 的 改善 。 


供 清晰 的 PST 框架 ， 并 设 定 温 暧 和 支持 性 的 对 话 环 境 。 通 过 这 种 方式 鼓励 开放 、 


迭代 测试 与 调整 是 设计 聊天 机 器 人 的 过 程 中 至 关 重 要 的 一 环 。 这 个 过 程 帮 助 


确保 聊天 机 器 人 产 出 的 内 容 不 仅 贴 近 问 题解 决 疗法 PST) 的 结构 和 原则 ， 而 且 


í 
能 够 实际 帮助 用 户 。 使 用 初始 提示 与 模型 进行 交互 , 观察 和 评估 输出 是 否 遵 循 问 


题解 决 疗法 的 四 个 步骤 。 如 果 输 出 与 期 望 不 一 致 ， 可 以 调整 提示 的 内 容 、 结 构 或 


用 词 , 直到 聊天 机 器 人 能 够 准 而 


测试 与 调整 的 具体 步骤 : 
。 ”迭代 测试 :利用 设计 好 的 初始 提示 语 指导 大 语言 模型 生成 合适 的 回复 内 容 。 


按照 问题 解决 疗法 的 流程 进行 对 话 。 以 下 为 碗 代 


初始 交互 可 能 是 一 个 简单 的 用 户 输入 ， 如 : "我 感到 非常 焦虑 ， 因 为 我 不 


确定 我 的 职业 道路 是 否 正确 。" 观 察 模型 的 啊 应 是 否 能 够 辨别 出 用 户 的 问 


题 ， 提 供与 PST 相符 的 目标 设 定 方法 ， 引 导 用 户 探索 可 能 的 解决 方案 ， 
并 最 终 帮助 用 户 制定 一 个 行动 计划 。 
。 评估 输出 :确认 模型 输出 是 否 遵循 了 PST 的 逻辑 :首先 是 问题 识 另 


是 目标 设 定 ， 然 后 是 探索 解决 方案 ， 最 后 是 人 
量 , 包括 建议 是 否 实用 、 是 否 尊 重用 户 自治 、 并 确定 是 否 有 助 于 用 户 从 不 


同 角 度 思考 问题 。 


。 ”输出 调整 :如 果 模 型 的 响应 未 能 正确 遵循 PST 的 步骤 ， 或 者 所 提供 
方案 不 切实 际 ， 那 么 需要 调整 提示 语言 。 调 整 可 能 包括 改善 指示 


l, RA 
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的 解决 


生 用 语 ， 


使 其 更 加 明晰 《〈 例 如， 指定 在 问题 识别 阶段 使 用 什么 类 型 的 开放 式 问题 )。 


增加 明确 性 ， 保 证 模型 引导 用 户 通过 具体 的 行动 步骤 而 非 模糊 的 指导 。 


。 重复 测试 :利用 调整 后 的 提示 重新 测试 ， 收 集 新 的 输出 ， 然 后 再 次 进行 评 
估 。 此 过 程 可 能 需要 多 次 迭代 , 每 一 次 都 根据 观察 到 的 问题 进行 精细 调整 。 


。 ”文档 记录 :在 每 轮 迭 代 后 ， 记 录 下 哪些 调整 是 有 效 的 ， 哪 些 是 无 效 的 。 文 
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于 未 来 在 类 似 任务 上 更 快 地 优化 提示 语 。 


。 用户 反 馈 集 成 :集成 真实 用 户 的 反馈 转 入 友 代 循环 ， 到 


解 何 种 类 型 的 提示 语 能 够 产生 更 贴近 预期 的 输出 ， 


也 有 上 


E 解 用 户 需 求 和 问题 ， 


并 扩展 对 话 的 适应 性 和 范围 。 用 户 反 馈 可 以 帮助 确定 提示 是 否 实际 便于 用 
户 理解 ， 以 及 模型 的 响应 是 否 符合 用 户 的 实际 需求 和 感受 。 


基于 问题 解决 疗法 编写 初始 prompt 


对 prompt 进 行 办 代 测试 与 调整 


i Cn a ee 


| 评 全 输出 | 


re 


ie aay 
[Saar 


a eens 


Pe a Saat nes ht tat cal 


图 1 提示 语 设计 流程 


。 最 终 确认 :在 多 次 测试 、 调 整 和 评估 后 ， 将 得 到 一 个 优化 过 的 提示 。 该 提 

示 有 助 于 聊天 机 器 人 高 效 地 协助 用 户 , 按照 PST 的 方法 处 理 和 解决 用 户 的 问题 。 
整体 的 反馈 和 完善 过 程 旨 在 打造 一 个 有 同 理 心 能 够 鼓励 用 户 自 我 探索 并 提 

供 结构 性 帮助 的 聊天 机 器 人 。 它 不 仅 反 映 了 PST 的 框架 ， 还 能 够 以 一 种 极 具 人 

性 化 的 方式 ， 回 应 用 户 的 具体 心理 和 情感 需求 。 

第 二 步 : 搭建 聊天 机 器 人 网 站 
编写 程序 ， 使 用 gradio 搭建 网 站 并 调用 chatgpt 接口 ， 基 于 训练 好 的 提示 语 

对 GPT4 进行 初始 化 (代码 示例 见 图 2)， 生 成 可 以 直接 进行 交互 的 聊天 机 器 人 

网 站 。 最 后 构建 的 PST 聊天 机 器 人 按照 问题 解决 疗法 的 四 个 核心 步 又 进行 工作 : 
。 问题 识别 :聊天 机 器 人 需要 识别 来 访 者 的 主要 困扰 和 挑战 。 鼓 励 用 户 直 接 

向 聊天 机 器 人 表达 自己 面临 的 困扰 或 问题 , 聊天 机 器 人 要 确保 用 户 感到 被 
理解 并 澄清 具体 的 问题 。 比 如 ,“ 这 个 问题 对 你 的 生活 产生 了 什么 影响 
We? ” 

。 目标 设 定 :明确 目标 设 定 对 于 成 功 解决 问题 至 关 重要 。 聊 天 机 器 人 可 以 引 
导 用 户 考虑 他 们 的 理想 结果 是 什么 ， 并 帮助 他 们 分 解 这 个 目标 成 为 更 小 、 
更 具体 的 行动 项 。 比 如 , “你 希望 在 解决 这 个 问题 后 ， 你 的 生活 或 情感 状 
态 有 什么 变化 ? ” 

。 ”探索 解决 方案 :鼓励 用 户 发 散 思维 ， 考 虑 多 种 可 能 的 解决 方案 。 机 器 人 可 


提供 指导 问题 促进 思考 ， 如 , “你 能 想到 什么 曾经 帮助 你 处 理 类 似 问 题 的 
策略 ? ”同时 ， 机 器 人 也 能 在 必要 时 提供 建议 和 资源 。 
。 制定 计划 :到 了 实施 的 阶段 ， 机 器 人 将 支持 用 户 制 定 具 体 的 行动 步骤 。 这 
可 以 包括 确定 时 间 表 、 资 源 、 人 际 文 持 ， 以 及 预见 和 规划 应 对 可 能 出 现 的 
困难 。 例 如 ,， “让 我 们 确定 你 的 第 一 步行 动 是 什么 以 及 何 时 开始 。” 


os.path.exists(args.user_init_command_path): 
(args.user_init_command_path 
user_init_command list= f.readlines() 
user_init_command = “".join(user_init_command_list) 


user_init_command = 


user_init_command!='"": 
| 
(user_init_command) 


2 使 用 prompt 对 聊天 机 器 人 进行 初始 化 的 代码 示例 


2.2 验证 PST 聊天 机 器 人 的 有 效 性 
(1) 预测 试 
招募 7 名 接受 过 问题 解决 疗法 培训 的 心理 咨询 方向 硕士 研究 生 , 作为 用 户 对 
PST 聊天 机 器 人 进行 试用 和 评价 。 预 测试 具体 步骤 如 下 : 
测试 准备 :从 技术 层面 确保 聊天 机 器 人 的 稳定 性 和 连通 性 ， 预 防 在 测试 过 程 
中 发 生 技术 故障 。 同 时 准备 了 明确 的 测试 指南 ， 包 括 测 试 流程 、 评 分 标准 、 操 作 
方式 和 反馈 方法 。 
用 户 引 导 : 在 正式 测试 之 前 ， 向 用 户 详细 介绍 PST 聊天 机 器 人 的 功能 、 预 期 
用 途 以 及 评分 的 具体 要 求 。 提 供 一 份 测试 协议 ， 明 确 说 明 保密 性 指南 、 数 据 使 用 
规则 以 及 用 户 的 权利 。 
进行 测试 : 让 用 户 与 PST 聊天 机 器 人 进行 交互 , 预测 试 的 网 页 指导 语 见 图 3。 
主 试 在 用 户 遇 到 任何 问题 时 即时 提供 技术 支持 。 鼓励 用 户 以 最 自然 的 方式 与 机 器 
人 互动 ， 就 像 他 们 在 现实 情境 中 与 人 互动 一 样 。 
收集 反馈 :测试 结束 后 ， 使 用 填写 问卷 的 方式 收集 用 户 的 反馈 。 对 话 结束 后 
立即 进行 ， 以 确保 反馈 的 准确 性 。 反 馈 内 容 包括 ; 
。 ”符合 问题 解决 疗法 流程 的 程度 
评分 准则 : 从 1 到 10 评分 ，1 表示 不 符合 PST 流程 ，10 表示 非常 符合 PST 
流程 。 显 示 了 聊天 机 器 人 遵守 或 偏离 PST 流程 的 情况 。 
。 ”解决 困扰 的 帮助 程度 


评分 准则 : 同样 从 1 到 10 评分 ，1 表示 没有 帮助 ，10 表示 极 大 帮助 。 请 求 

评分 人 提供 他 们 如 何 使 用 聊天 机 器 人 提供 的 解决 方案 , 或 是 怎样 的 对 话 帮 助 

他 们 思考 问题 。 

。 ”具体 改进 建议 

邀请 用 户 基 于 他 们 的 专业 知识 和 互动 体验 提出 具体 的 改进 意见 。 

收集 关于 提示 语 构 建 、 流 程 引 导 、 回 应 质量 等 方面 的 改进 建议 。 

。 ”完整 聊天 时 长 

记录 用 户 与 聊天 机 器 人 交互 的 完整 时 长 , 以 此 判断 用 户 参 与 度 及 单 次 会 话 的 

时 间 效率 。 

数据 分 析 与 迭代 优化 : 对 收集 到 的 数据 进行 整理 和 分 析 ， 使 用 定量 数据 〈 评 
分 ) 和 定性 数据 (改进 建议 ) 结合 的 方式 测量 效果 。 然 后 根据 反馈 结果 制定 优化 
策略 ， 如 调整 对 话 流程 、 增 强 回 应 的 相关 性 或 提升 聊天 逻辑 的 人 性 化 程度 。 对 聊 
天 机 器 人 进行 必要 的 技术 改进 。 


PST 聊 天 机 器 人 


就 可 以 使 原本 存在 的 负 人 性 情绪 《如 抑 帮 、 先 虚 ) 加 覃 ， 或 者 本 来 没有 负面 司 绪 的 人 出 现 负 性 尾 绪 ， 而 负 性 情绪 会 让 我 们 缺 过 动机 ， 感 
题 ， 缺 季 对 自己 生活 的 掌控 感 ， 央 此 我 们 会 感觉 更 糖 崇 ， 问 题解 决 疗 法 就 是 通过 找 山 问题 ， 而 对 问题 ， 技 一 奉行 之 有 效 的 、 系 统 的 步 村 去 解决 问 


说 出 你 的 感受 或 困扰 吧 ， 然 后 点 击 "可 交 " 即 可 


图 3 预测 试 聊天 机 器 人 的 网 页 指导 语 界面 


(2) 正 式 用 户 实验 

根据 预测 试 结果 对 PST 聊天 机 器 人 进行 优化 后 ， 开 展 线 上 正式 用 户 实验 。 
共 招 募 了 100 名 感染 过 新 冠 的 青年 用 户 进行 实验 ， 随 机 分 配 到 实验 组 和 对 照 组 ， 
年 龄 范围 在 18~35 岁 。 正 式 实验 过 程 中 确保 实验 组 和 对 照 组 除了 使 用 的 聊天 机 器 
人 不 同 ， 其 他 流程 都 相同 ， 正 式 实验 的 聊天 机 器 人 网 页 指导 语 见 图 4。 

实验 组 : 共 50 人 ， 其 中 男生 18 人 ， 女 生 32 人 。 体 验 训 练 好 的 PST 聊天 机 
aA, 通常 4~8 轮 交 互 后 聊天 机 器 人 会 给 出 友好 结束 语 (如 “今天 的 咨询 就 到 这 
里 了 2” 并 提供 一 些 心 理 健康 热线 ， 然 后 可 以 结束 使 用 聊天 机 器 人 ， 填 写 用 户 体 
验 问卷 。 

对 照 组 : 共 50 人 ， 其 中 男生 22 人 ， 女 生 28 人 人。 体验 没有 被 训练 过 的 普通 


聊天 机 器 人 ，4~8 轮 交 互 后 可 以 结束 使 用 聊天 机 器 人 ， 并 填写 用 户 体验 问卷 。 
具体 实验 流程 如 下 : 

。 设计 用 户 体验 问卷 ， 主 试 通过 查阅 文献 ， 参 考 问卷 设计 流程 ， 编 制 
初步 问卷 。 然 后 请 自杀 研究 领域 的 心理 学 教授 对 初 编 问 卷 的 维度 分 类 和 具体 
题目 提出 改进 建议 , 最 终 修 订 的 用 户 体验 问卷 包括 对 聊天 机 器 人 三 个 维度 的 
评价 : 问题 认 知 、 问 题解 决 和 关系 质量 ， 共 17 道 题 ， 有 具体 题目 见 表 1。(1) 
问题 认 知 维度 , 代表 帮助 用 户 对 当前 困扰 自己 的 问题 有 了 更 清晰 认识 的 程度 ， 
1~5 题 。(2) 问题 解决 维度 ， 代 表 让 用 户 更 清楚 应 该 用 什么 方法 解决 当前 困 
扰 自 己 的 问题 ，6~11 题 。(3) 关系 质量 维度 ， 代 表 用 户 与 聊天 机 器 人 的 关 
系 质量 水 平 ， 关 系 质量 越 高 表明 用 户 越 乐 于 跟 聊 天 机 器 人 进行 交流 ， 包 括 
12~17 题 。 采 用 李 克 特 10 点 评分 ， 从 “1” 代 表 非 常 不 同意 ， 到 “10” 代 表 


Ey 一 | ze. 

i [AI x 0 
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图 4 正式 实验 聊天 机 器 人 的 网 页 指导 语 界 面 


。 实验 准备 : 确保 技术 平台 稳定 ， 可 以 承载 并 运行 两 种 不 同 版 本 的 聊 
天 机 器 人 ， 分 别 为 优化 过 的 PST 聊天 机 器 人 与 未 经 专门 训练 的 普通 聊天 机 
器 人 。 

。 用 户 招 募 与 分 配 : 招募 感染 过 新 冠 的 青年 人 ， 确 保 自 愿 参与 且 知 晓 
研究 目的 和 使 用 的 数据 类 型 。 使 用 随机 分 配 的 方式 , 确保 实验 组 与 对 照 组 人 
数 相等 ， 性 别 分 配 比例 接近 。 

。 常规 操作 说 明 : 向 用 户 介 绍 聊天 机 器 人 实验 的 基础 操作 ， 并 强调 隐 
私 安全 性 指南 。 确保 用 户 理解 结束 语 的 含义 , 并 告知 其 在 实验 结束 后 需要 填 
写 用 户 体验 问卷 。 

。 数据 分 析 : 在 实验 结束 后 ， 收 集 所 有 用 户 完成 的 问卷 数据 ， 使 用 独 
立 样 本 t 检 验 比 较 两 组 间 的 评分 差异 ， 评 估 PST 聊天 机 器 人 的 效果 。 


1. 与 聊天 机 器 
人 的 交流 让 我 对 革 
扰 自 己 的 问题 认识 
更 清晰 

2. 与 聊天 机 器 
人 的 交流 帮助 我 更 
有 远 辑 地 梳理 了 自 
己 的 问题 
3. 与 聊天 机 器 
人 的 交流 让 我 对 
扰 自 己 的 问题 有 
些 新 的 认识 

4. 与 聊天 机 器 
人 的 交流 让 我 对 解 
决 问题 过 程 中 希望 
实现 的 结果 有 更 明 
确 的 目标 
5. 与 聊天 机 器 
人 的 整个 聊天 过 程 
始终 围绕 在 我 想 解 
决 的 问题 上 


表 1 聊天 机 器 人 用 户 体验 问卷 


6. 聊 天 机 器 人 
在 对 我 的 问题 有 
定 了 解 之 后 才 会 给 
与 我 建议 

7. 聊 天 机 器 人 
给 予 的 建议 我 来 说 
是 有 用 的 


8. 聊 天 机 器 人 
给 予 的 建议 对 我 来 
说 是 可 行 的 


9. 与 聊天 机 器 
人 的 交流 让 我 对 解 
决 当下 困扰 我 的 问 
题 有 了 一 些 新 的 思 
考 

10. 与 聊天 
机 器 人 的 交流 让 我 
对 如 何 解决 当下 困 
扰 我 的 问题 有 了 一 
些 计划 


11. 聊天 机 
器 人 对 解决 当下 困 
扰 我 的 问题 有 帮助 


2 与 聊天 
机 器 人 的 交流 让 我 


有 一 种 支持 感 


13. 我 觉得 
聊天 机 器 人 是 可 信 
任 的 


14. FAK 
真人 ， 我 更 愿意 向 
聊天 机 器 人 倾诉 我 
的 问题 

15. 与 聊天 
机 器 人 聊 完 之 后 ， 
我 对 解决 问题 有 了 


一 些 信心 


16. 与 聊天 
机 器 人 聊 完 之 后 ， 
我 感到 心情 放松 了 


一 些 


I RES 
次 仍然 愿意 向 聊天 
机 器 人 寻求 支持 和 
帮助 


3 研究 结果 
3.1 预测 试 结 果 

7 名 接受 过 问题 解决 疗法 培训 的 心理 咨询 方向 研究 生 对 PST 聊 天 机 器 人 的 评 
分 结果 见 表 2, 测试 结果 表明 PST 聊天 机 器 人 总 的 来 说 符合 问题 解决 疗法 的 流程 
设计 , 可 以 对 人 们 解决 问题 困扰 起 到 帮助 , 并且 可 以 利用 自己 强大 的 知识 库 在 短 
时 间 内 帮助 用 户 理 清 头 绪 ， 找 到 有 用 的 问题 解决 方法 并 制定 行动 计划 。 

有 具体 改进 建议 被 整理 至 表 3, 已 经 采纳 其 中 一 些 建议 并 对 PST 聊天 机 器 人 进 
行 改 进 ， 但 部 分 建议 由 于 技术 原因 或 其 他 客观 因素 并 未 采纳 。 根 据 改进 建议 ， 新 
增 PST 聊天 机 器 人 在 完成 工作 流程 后 会 额外 提供 一 些 可 用 的 心理 干预 热线 ， 让 
用 户 在 需要 时 可 以 拨打 热线 电话 寻求 专业 人 士 的 帮助 。 


G 


表 2 预测 试 评分 结果 


流程 符合 程度 评分 (10 分 ) 有 效 性 评分 (10 分》 一 次 完整 聊天 时 长 〈 分 钟 ) 
9 10 6 

10 9 7 

9 9 10 

7 5 12 

7 7 12 

8 9 10 

9 9 7 

平均 得 分 : 8.43 平均 得 分 : 8.23 平均 时 长 : 9.14 


表 3 具体 改进 建议 

1 希望 可 以 保存 咨询 记录 ， 可 以 自主 选择 创建 新 的 还 是 接着 旧 的 问题 咨询 。 

2 ”在 聊天 体验 上 ， 真 的 很 不 错 很 不 错 ， 但 对 我 自己 我 会 觉得 对 于 没有 什么 

大 问题 的 人 ， 效 果 可 能 不 会 很 好 ， 因 为 感觉 这 样 的 流程 对 小 事 来 说 过 于 隆重 。 
3 ”是 否 可 以 像 人 工 咨询 一 样 提供 一 些 辅助 问题 解决 的 各 种 渠道 ， 比 如 热线 
阿 线 下 咨询 的 预约 方法 呀 等 等 。 
4 ”在 聊天 的 过 程 中 ， 机 器 人 会 详细 询问 我 目前 过 到 的 困难 ， 并 给 出 一 些 看 


助 解决 的 策略 ， 但 是 我 并 没有 感受 到 它 对 于 我 情绪 的 安抚 ， 我 认为 可 以 在 了 解 
情况 后 先 对 我 的 情绪 状态 给 我 一 些 回 复 ， 再 去 提出 问题 解决 策略 ， 这 样 能 够 增强 
聊天 机 器 人 的 人 文 关 怀 性 。 

5 feted 
的 网 址 ， 或 者 推荐 i 籍 ， 这 样 会 比 几 句 话 提出 的 解决 策略 更 有 权威 性 。 


6 ”聊天 框 最 下 方 的 时 间 和 进度 加 载 窗口 或 许可 以 去 除 或 者 换 一 种 呈现 方 
式 ， 这 样 看 起 来 很 像 是 代码 运行 过 程 。 


7 真 的 很 棒 ! 并 且 我 真 的 有 收获 , 感觉 思路 清晰 了 很 多 ! 在 聊天 形式 上 ,我 


个 人 的 拙 见 )， 可 以 加 一 些 更 加 人 性 化 的 表述 ， 比 如 适当 加 入 语气 词 或 者 标点 ， 更 
能 拉 近 距离 。 


3.2 正式 用 户 实验 结果 

采用 独立 样本 t 检 验 对 数据 进行 分 析 , 结 果 见 表 4。 结 果 表 明 在 问题 认 知 维度 ， 
实验 组 的 评分 显著 高 于 对 照 组 (t(88.31) = 3.14, p = 0.002), 说 明 PST 方式 的 干预 
可 以 更 有 效 的 帮助 用 户 识别 和 理解 他 们 所 面临 的 问题 。 用 户 能 够 通过 与 PST H 
天 机 器 人 的 互动 更 准确 地 识别 问题 , 对 问题 有 更 清晰 的 认识 , 这 是 问题 解决 的 重 
要 第 一 步 。 

在 问题 解决 维度 ， 实 验 组 也 显著 优 于 对 照 组 (t(98) = 3.34, p = 0.001)， 表 明 
PST 聊天 机 器 人 在 引导 用 户 思考 和 选择 解决 问题 的 策略 上 更 为 有 效 。 用 户 更 倾向 
于 使 用 PST 聊天 机 器 人 提供 的 方法 去 应 对 和 解决 问题 ， 指 出 了 PST 聊天 机 器 人 
在 提升 用 户 问 题解 决 技能 上 的 潜在 价值 。 

但 在 关系 质量 维度 ， 实 验 组 和 对 照 组 的 差异 不 限制 〈t(91.23) = 1.07, p= 
0.286), 这 可 能 意味 着 用 户 与 PST 聊天 机 器 人 及 普通 聊天 机 器 人 建立 关系 的 质量 
大 致 相当 , 或 者 这 种 人 机 交互 关系 的 质量 并 未 因为 使 用 问题 解决 疗法 而 有 所 提高 。 
也 可 能 是 因为 用 户 对 于 聊天 机 器 人 的 接纳 度 本 身 就 比较 高 , 或 者 关系 质量 更 多 受 
到 其 他 因素 〈 如 聊天 界面 的 友好 程度 、 机 器 人 的 响应 速度 等 ) 的 影响 。 

如 表 5 和 表 6 所 示 , 没有 在 性 别 和 新 冠 后 遗 症 这 两 个 因素 上 发 现 对 两 种 聊天 
机 器 人 评价 有 差异 , 这 表明 聊天 机 器 人 的 有 效 性 在 不 同性 别 的 用 户 和 有 无 新 冠 后 
遗 症 的 用 户 之 间 是 普遍 的 。 这 一 点 对 于 聊天 机 器 人 的 推广 尤为 重要 ,因为 这 表明 
聊天 机 器 人 不 需要 针对 性 别 或 感染 后 的 状态 进行 太 多 个 性 化 调整 , 具有 很 好 的 通 
用 性 。 


表 4 实验 组 与 对 照 组 的 比较 结果 


评价 维度 组 别 M SD t df p 
问题 认 知 实验 组 (n=50) 40.04 4.74 
3.14 88.31 0.002 
对 照 组 (n=50) 36.40 6.69 
问题 解决 实验 组 (n=50) 47.98 6.06 


3.34 98 0.001 


对 照 组 (n=50) 43.36 7.67 
关系 质量 实验 组 (n=50) 46.52 7.95 
1.07 91.23 0.286 
对 照 组 (n=50) 44.52 10.52 
表 5 性 别 比 较 结果 
评价 维度 组 别 M SD t df p 
问题 认 知 男 (n=40) 37.38 6.08 
-1.14 98 0.256 
女 (n=60) 38.78 6.02 
问题 解决 男 (n=40) 45.68 7.65 
0.01 98 0.996 
女 a=60) 45.67 7.05 
关系 质量 男 (n=40) 44.15 8.98 
-1.20 98 0.233 
女 (n=60) 46.43 9.52 


表 6 新 冠 后 遗 症 比 较 结果 


评价 维度 组 别 M SD t df p 

问题 认 知 有 后 遗 症 。 38.68 5.72 
(n=31) -1.14 98 0.256 
无 后 遗 症 。” 38.01 6.23 
(n=69) 

问题 解决 有 后 遗 症 。” 47.4194 7.08 
(n=31) 0.01 98 0.996 
无 后 遗 症 。” 44.8841 7.25 
(n=69) 

关系 质量 有 后 遗 症 46.9032 8.11 
(n=31) -1.20 98 0.233 
无 后 遗 症 。” 44.8986 9.83 
(n=69) 

4 讨论 


研究 对 PST 聊天 机 器 人 和 普通 聊天 机 器 人 在 三 个 维度 : 问题 认 知 、 问 题解 


决 和 关系 质量 进行 了 比较 ， 发 现 PST 聊天 机 器 人 在 提升 问题 认 知 和 问题 解 诀 维 
度 上 对 用 户 有 显著 帮助 。 这 可 能 是 因为 PST 聊天 机 器 人 的 工作 流程 符合 解决 问 
题 的 逻辑 链 , 可 以 帮助 用 户 更 快 发 现 问题 的 核心 ， 以 及 可 以 提出 更 有 和 针对 性 的 建 
议 ， 帮 助 用 户 明 白 接 下 来 应 该 如 何 解决 问题 (Pandey & Sharma, 2023). 

在 问题 认 知 维度 上 ， 实 验 组 的 得 分 显著 高 于 对 照 组 ， 这 可 能 意味 着 PST H 
天 机 器 人 通过 具体 和 结构 化 的 干预 帮助 用 户 形成 了 对 困扰 问题 更 清晰 的 认识 。 此 
效果 可 能 与 Vlaescu 等 人 (2016) 的 发 现 一 致 ， 他 们 提 到 利用 技术 进行 心理 健康 干 
预 能 够 帮助 用 户 更 好 地 理解 治疗 内 容 并 进行 自我 管理 。 

实验 组 与 对 照 组 在 问题 解决 维度 上 的 显著 差异 ， 强 调 了 PST 聊天 机 器 人 在 
提供 问题 解决 方案 方面 的 潜在 好 处 。 这 与 Fitzpatrick 等 人 (2017) 的 研究 相 呼应 ， 
引出 数字 健康 干预 能 够 有 效 协 助 个 体 识别 问题 并 探索 可 能 的 解决 方案 , 进而 可 能 
有 助 于 改善 个 体 整 体 的 心理 健康 状况 。 

然而 ， 在 关系 质量 维度 上 ， 未 发 现实 验 组 和 对 照 组 之 间 的 显著 差异 ， 表 明 用 
户 倾向 于 与 PST 聊天 机 器 人 和 普通 聊天 机 器 人 交流 的 程度 相似 。 这 可 能 是 因为 
关系 建立 在 聊天 机 器 人 上 的 功能 受 限 ,这 一 发 现 与 Miner 等 人 (2017) 的 观点 相符 ， 
他 们 认为 聊天 机 器 人 的 关系 建立 需要 更 人 性 化 的 交互 设计 。 

此 外 ,性别 和 有 无 新 冠 后 遗 症 在 评价 聊天 机 器 人 的 效用 上 未 表现 出 显著 差异 ， 
这 一 结果 暗示 了 聊天 机 器 人 的 潜在 普 适 性 。 这 与 Schueller 等 人 (2016) 的 研究 一 
致 , 他 们 发 现 科技 辅助 的 心理 干预 无 需 针对 特定 的 性 别 或 健康 状况 进行 大 量 的 个 
性 化 修改 。 尽管 如 此 , 针对 不 同性 别 和 健康 状态 个 体 或 许可 以 开发 更 具 针 对 性 的 
PST 程序 ， 以 加 强 个 体 化 的 干预 效果 。 

需要 注意 的 是 ， 尽 管 PST 聊天 机 器 人 在 特定 心理 干预 维度 上 显著 优 于 普通 
聊天 机 器 人 , 但 仍 需 进一步 的 研究 来 探索 其 长 期 效果 以 及 在 临床 环境 中 的 应 用 前 
Ro 未 来 的 研究 可 采用 更 大 样本 量 , 更 长 时 间 跨 度 的 随机 对 照 试 验 来 进一步 检验 
这 些 初步 发 现 。 


5 结论 

研究 通过 对 经 历 过 新 冠 感染 的 青年 人 群 进行 实验 ， 考 察 了 PST 聊天 机 器 人 
相 较 于 普通 聊天 机 器 人 在 多 个 维度 上 的 效果 。 研 究 结果 支持 PST 聊天 机 器 人 在 
心理 健康 干预 中 的 应 用 , 特别 是 在 帮助 用 户 识别 问题 和 探索 解决 方案 方面 。 即便 
PST 聊天 机 器 人 的 人 机 关系 质量 没有 显著 提升 , 但 聊天 机 器 人 的 普遍 可 接受 性 和 
广泛 适用 性 仍然 为 其 在 心理 健康 领域 的 进一步 开发 和 利用 提供 了 积极 的 预期 。 
PST 聊天 机 器 人 展示 了 人 工 智能 技术 实现 心理 健康 自助 干预 的 可 能 性 , 可 以 作为 
现 有 心理 健康 资源 的 补充 工具 。 


H 
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